Introducción al Aprendizaje Estadístico

Marcelo Araya-Salas
Universidad de Costa Rica

¿Qué es el Aprendizaje Estadístico?


  • Utilización de datos para modelar fenómenos, hacer predicciones y tomar decisiones basadas en la información extraída

  • Combina teorías estadísticas con algoritmos computacionales

¿Qué es el Aprendizaje Estadístico?

Inteligencia Artificial: hacer tareas que requieren inteligencia humana

Aprendizaje estadístico: uso de algoritmos para analizar datos, aprender de ellos, y hacer predicciones

¿Qué es el Aprendizaje Estadístico?

Inteligencia Artificial: hacer tareas que requieren inteligencia humana

Aprendizaje estadístico: uso de algoritmos para analizar datos, aprender de ellos, y hacer predicciones

Aprendizaje Profundo: uso de redes neuronales profundas para analizar diversos niveles de abstracción en los datos

Ciencia de Datos: técnicas de análisis, procesamiento, y visualización de datos para extraer información/conocimiento de grandes volúmenes de datos

¿Qué es el Aprendizaje Estadístico?

\[ Y = f(X) + E \]

  • Y: variable dependiente (se quiere predecir o explicar)
  • X: variable(s) independiente(s) con información relevante para predecir Y
  • E: error no reducible

¿Qué es el Aprendizaje Estadístico?

\[ Y = f(X) + E \]

  • sinónimos de Y: variable dependiente, resultado (outcome), etiqueta, objetivo, etc.
  • sinónimos de X: variable independiente, atributo (feature), dimensión, predictor, entrada (input), etc.

¿Para que Estimar f(X)?

\[ Y = f(X) + E \]

  • Predicción: predecir valores futuros de Y

  • Inferencia: establecer una relación causal (i.e. estimar el efecto de un cambio en X sobre el cambio en Y)

Aprendizaje estadístico = estimar f(X)

Aplicaciones

Omnipresente en herramientas electrónicas:

  • Detección de correo spam: busca patrones en el contenido del mensaje, como palabras clave sospechosas y comportamientos de envío
  • Reconocimeinto facial: analiza las características faciales desde diferentes ángulos y aprenden a reconocer variaciones sutiles en la apariencia de un individuo
  • Optimización de Rutas con GPS: usa los patrones de tráfico históricos y en tiempo real para predecir y sugerir las rutas más rápidas o eficientes

Aplicaciones en Ciencias Cognoscitivas

Crucial para entender cómo procesamos la información, tomamos decisiones y aprendemos. Algunos sub-campos que utilizan estas herramientas:

  • Neurociencia Cognitiva: Identificación de patrones en la actividad cerebral relacionados con diferentes funciones cognitivas
  • Psicología Experimental: Modelado de comportamiento humano y predicción de respuestas psicológicas
  • Neurociencia Computacional: Modelado de la actividad neuronal para simular procesos cerebrales

Aplicaciones: Memoria

  • Recuerdo verídico (r = -0.43) y la fuerza de la asociación entre items (r = 0.73) influyen

\(Y: recuerdo\ falso \sim X: asociacion\ entre\ items + recuerdo\ verídico + ...\)

Aplicaciones: Reconocimiento de Emociones

\(Y: emoción \sim X: estructura\ acústica\)

Aplicaciones: Resilencia al Estrés

\(Y:resilencia\ (binaria) \sim X: género + edad + educación + ...\)

Tipos de Modelos

Supervisado: Se predice una Y conocida a priori

\[ Y = f(X) \]

Y X1 X2 X3
-0.56 1.72 1.22 1.79
-0.23 0.46 0.36 0.50
1.56 -1.27 0.40 -1.97
0.07 -0.69 0.11 0.70
0.13 -0.45 -0.56 -0.47

Tipos de Modelos

Supervisado: Se predice una Y conocida a priori

\[ Y = f(X) \]

Y X1 X2 X3
A -0.55 -1.60 -0.83
C -0.02 0.66 -0.62
B -0.58 -1.87 -0.29
C 1.07 0.26 -0.50
A 1.04 -0.22 1.10

Tipos de Modelos

No supervisado: genera una Y con base en la estructura de X

\[ f(X) \]

Y X1 X2 X3
? -0.56 1.72 1.22
? -0.23 0.46 0.36
? 1.56 -1.27 0.40
? 0.07 -0.69 0.11
? 0.13 -0.45 -0.56

Tipos de Modelos

No supervisado: ó explora la estructura de X

\[ f(X) \]

X1 X2 X3
-0.56 1.72 1.22
-0.23 0.46 0.36
1.56 -1.27 0.40
0.07 -0.69 0.11
0.13 -0.45 -0.56

Escogiendo el Modelo Adecuado


¿Existe Y?


Escogiendo el Modelo Adecuado


Si Y existe ¿Es continua o categórica?


Escogiendo el Modelo Adecuado


Si Y no existe ¿Queremos generarla o solo explorar X?


Escogiendo el Modelo Adecuado


Escogiendo el Modelo Adecuado

Escogiendo el Modelo Adecuado

Escogiendo el Modelo Adecuado

Interpretabilidad

Tomado de Badillo et al 2020

Introducción al Aprendizaje Estadístico

Marcelo Araya-Salas
Universidad de Costa Rica